FakeQuantWithMinMaxVarsPerChannel
对输入数据执行按通道(Per-Channel)的逐元素伪量化运算。该算子将输入数据划分为 channel_num 个等长的通道,每个通道根据其对应的最小/最大值(min_val[c] / max_val[c])独立计算缩放因子和零点,进行模拟量化与反量化。
\[channel\_size = \frac{length}{channel\_num}\]
\[\text{对于通道 } c: \quad scale_c = \frac{max\_val_c - min\_val_c}{quant\_max - quant\_min}\]
\[output_{c,i} = \text{FakeQuant}(input_{c,i}, scale_c, nudge\_min_c)\]
- 输入:
src - 输入数据地址。
min_val - 每个通道最小值组成的数组地址。
max_val - 每个通道最大值组成的数组地址。
length - 输入数据总长度(需能被通道数整除)。
quant_min - 量化后的整数最小值。
quant_max - 量化后的整数最大值。
symmetric - 是否使用对称量化。
channel_num - 通道数量。
core_mask(int, 可选) - 核掩码(仅适用于共享存储版本)。
- 输出:
output - 伪量化后的计算结果地址。
- 支持平台:
FT78NEMT7004
备注
FT78NE 支持:fp32 (fp)
MT7004 支持:fp16 (hp), fp32 (fp)
输入数据的总长度
length必须可以被channel_num整除。每个通道的逻辑(包括 Nudge 零点调整)与单变量版本的伪量化一致。
共享存储版本:
-
void fp_fake_quant_with_min_max_vars_per_channel_s(float *src, float *min_val, float *max_val, float *output, int length, int quant_min, int quant_max, bool symmetric, int channel_num, int core_mask)
-
void hp_fake_quant_with_min_max_vars_per_channel_s(half *src, half *min_val, half *max_val, half *output, int length, int quant_min, int quant_max, bool symmetric, int channel_num, int core_mask)
C调用示例:
1// FT78NE 示例:fp32 类型共享存储多核计算 2#include <stdio.h> 3#include <stdbool.h> 4#include "78NE/utils.h" 5 6int main(int argc, char* argv[]) { 7 float *input = (float *)0xA0000000; 8 float *min_arr = (float *)0xA1000000; 9 float *max_arr = (float *)0xA1001000; 10 float *output = (float *)0xB0000000; 11 int length = 960000; 12 int channel_num = 100; 13 int core_mask = 0b1011; 14 15 fp_fake_quant_with_min_max_vars_per_channel_s(input, min_arr, max_arr, output, 16 length, 0, 255, false, channel_num, core_mask); 17 return 0; 18}
私有存储版本:
-
void fp_fake_quant_with_min_max_vars_per_channel_p(float *src, float *min_val, float *max_val, float *output, int length, int quant_min, int quant_max, bool symmetric, int channel_num)
-
void hp_fake_quant_with_min_max_vars_per_channel_p(half *src, half *min_val, half *max_val, half *output, int length, int quant_min, int quant_max, bool symmetric, int channel_num)
C调用示例:
1// MT7004 示例:fp16 (half) 类型私有存储单核计算 2#include <stdio.h> 3#include <stdbool.h> 4 5int main(int argc, char* argv[]) { 6 half *input = (half *)0x10000000; 7 half *min_arr = (half *)0x10008000; 8 half *max_arr = (half *)0x10008100; 9 half *output = (half *)0x10009000; 10 int length = 2000; 11 int channel_num = 10; 12 13 hp_fake_quant_with_min_max_vars_per_channel_p(input, min_arr, max_arr, output, 14 length, 0, 255, true, channel_num); 15 return 0; 16}